2012/10/15

[摘譯] 人類記憶的終極指南

原文:The ultimate guide to memory - New Scientist

我們是記憶的集合。記憶限制了我們如何思考,如何行動與決策,甚至,定義了我們是誰。

然而,記憶的諸多優點與瑕疵,幾個世紀以來,對人類而言都是個巨大的謎團。記憶如何形成?在大腦裡如何儲存?為什麼我們記得某些事情,卻不記得另一些事件?我們應該如何善用、增強這個演化而來的工具?

在以下的文章中,我們試著回答上面些問題,以及其他許許多多關於記憶的疑惑。讓我們由「為什麼會有記憶」這件事的革命性看法開始。


簡介

記憶:為了接下來要發生的事情

記憶的目的,其實是為了要對未來做出預測,而非對過去保存記錄。
比較心理學

動物會遺忘嗎?

從記得人臉的鴿子,到會囤積石塊攻擊人類的猩猩,所有的動物都有記憶。這些記憶能力,跟人類有什麼不同嗎?
自傳式記憶

記憶如何杜撰我們的生活故事

自傳是生活中許多事件的集合,而我們的記憶決定了哪些片段該被選進這個專輯之中。
心理健康

堅強你的精神堡壘

與我們的過去連結,可以幫助我們抵抗憂鬱或重大創傷後壓力症候群,而這個發現帶來了新的心理治療方法。
健忘

迷失在此時此刻

健忘的人表現出身體與記憶間的奇特互動。
增強記憶

六式絕藝讓你成為記憶大師

想要憑著意志去選擇記得或遺忘嗎?這裡有六招不傳之祕。


譯按:這期 New Scientists 的封面專題,只翻譯了引言,以上連結皆為原文。

2012/10/11

[Data Analytics] 打造資料科學團隊

Big Data 的話題正炒得熱火朝天,好像每間公司都要有自己的資料科學團隊一般。但是要如何打造這樣的團隊,如何讓資料科學團隊直接對企業的獲利做出貢獻?

DJ Patil 在 O'Reilly Radar 出版的報告 Building data science teams 當中,以 Facebook 和 LinkedIn 組建資料與分析團隊的經驗分享為主軸,討論了企業如何轉型成「資料驅動」(data-driven),相關的產品與服務設計,以及資料科學家在這個過程當中扮演的角色。

Patil 提出「資料科學」在企業當中的功能,可以分為幾類:

  • 決策科學與商務智慧
  • 產品與行銷分析
  • 風險管理與安全性(偵測詐騙及濫用)
  • 資料服務與日常營運的輔助
  • 資料工程與資訊架構
  • 組織架構與報表的同步

如果說 Patil 的文章,講的是從實務經驗當中去定義出「資料科學」,Nicole Laskowski 的這篇
Interviewing data scientist candidates? Ask these questions 就比較像是想成為資料科學家的人,或是想建立資料科學團隊的企業主管的面試教戰手冊。這篇文章訪問了SAS的分析長 Bill Franks,討論了他甄選資料科學家的一些條件。

最後,附上一段 DJ Patil 的訪談,有趣的是一些資深業界人士認為最適合這項工作的教育背景其實不是資訊科技,而是天文、氣象學這類每天在浩瀚資料裡游泳的物理學專才。不過既然人際的 softskill 也是資料科學家必備的能力,那麼 The Big Bang Theory 裡的 Sheldon Cooper 大概就不太適合這個工作了,Bazinga! XD

2012/10/02

[Data Analytics] Data Analytics Boot Camp

日前參加了 The Modeling Agency 舉辦的 Data Analytics Boot Camp,算是一個小型的 workshop,由資深的 Data Analytics Consultant 主持,除了主講者本身的經驗談之外,也讓各行各業使用 Data Mining 的參與者一起分享彼此的經驗。

之前報名舊金山的場次因故無法成行,這次改參加 Washington DC 的場次,主持人 Tony Rathburn 算是業界小有名氣的資深顧問與講師,在 Data Mining Research 上有關於他的訪談

Tony Rathburn 其實是他撰寫部落格的「藝名」,在兩天的座談裡,Tony 分享了他二十多年來做為資訊系統與資料探勘顧問的一些心得,以及在各個行業裡要應用這種工具所需要注意的要點。從大學教授轉戰業界,Tony 的見解相當獨到,而對於他沒有經歷過的領域(就是小弟向他請益的部份),所提出的建議也非常實用。

兩天的討論內容,當然不太可能短短的篇幅裡道盡細節,不過有幾個個人覺得蠻重要的觀念,倒是可以先摘要出來,以後再慢慢細述。

  • Data Analytics 的作用,是利用收集到的資料以及設計出的分析工具,來針對決策做出輔助,真正的目的在於「提高決策的效益」。
  • Data Analytics 專案的重點,會在於對整個決策歷程、所涉及的商業模式以及績效指標的理解,使用的分析與資料工具反而是次要的。
  • 善用對專案所欲解決問題的理解,盡可能的把解決方案設計成直接與績效指標相關的 binary classification,退而求其次是 multi-label classification,真的萬不得已才使用回歸預報的方式。(個人過去的專案經驗當中對此也有深深的同感,Tony 的說法是「因為我懶惰」,但是實則有更深刻的數學理由,有機會以後再討論)
  • 區分 Big Data 和 Fat Data 的不同:對於大多數的現實問題,Big Data 只能提高準確率(而且很有限),Fat Data 才能針對問題找出更多的洞見。(之前摘錄的一篇「大資料與小資料」中的引文也有探討類似的問題)

這些觀念都伴隨著許許多多的實例討論,包括來自 JP Morgan Chase 的毛先生分享金融商品交易的技術。

因為這次舉行的地點是在美國首都,所以有一半的與會成員是美國人事行政局的員工,包含資訊與專案規劃的人員,他們對於每年哪些公務員會退休的預測有很大的興趣,因為這會牽涉到整個人事行政策略的全盤規劃。年底還有一次在 Las Vegas 舉辦的座談會,不知道會不會有賭場的代表參加呢?我個人倒是對這個蠻有興趣的。

總之,覺得參加這個座談會的收穫頗為豐富,只是為了這個要跑一趟美國實在有點累,只好等下次有長假時再看看有沒有機會了。